Es el valor que se encuentra en el centro de una secuencia ordenada
de datos. Hay la misma cantidad de datos por encima y por debajo de
ella.
\(\begin{equation}
\text{Mediana} =
\begin{cases}
X_{\frac{n+1}{2}}, & \text{si } n \text{ es impar} \\
\frac{X_{\frac{n}{2}} + X_{\frac{n}{2} +1}}{2}, & \text{si } n
\text{ es par}
\end{cases}
\end{equation}\)
Ventaja: fácil de interpretar y calcular, no es
sensible a valores extremos.
Moda
Es el valor que aparece con mayor frecuencia, se utiliza en fines
descriptivos ya que es muy variable para diferentes muestras. Puede
haber más de una moda.
Un conjunto de datos puedes ser unimodal, bimodal o multimodal.
Ejemplo
Calcular la media, mediana y moda de la edad, altura y dinero en
efectivo de los estudiantes del grupo 6 de Estadística General:
Id
Edad
Altura
(cm)
Dinero
en efectivo (COP)
1
18
170
2000
2
20
180
65000
3
21
178
20000
4
22
159
20000
5
20
158
2500
6
20
175
100
7
21
162
1000
8
23
172
20
9
20
184
30
10
19
155
45
11
22
164
50000
12
26
175
1500000
13
22
180
1000000
14
20
185
250
15
23
178
60000
16
21
173
200000
17
22
162
50
18
21
173
52
19
22
168
40
20
20
165
4
21
23
180
150
Ejemplo
Calcular la media, mediana y moda de la edad, altura y dinero en
efectivo de los estudiantes del grupo 6 de Estadística General:
[1] "La variable Edad (años) tiene una media de 21.24, su mediana es 21 y su moda es 20"
[1] "La variable Altura (cm) tiene una media de 171.24, su mediana es 173 y su moda es 180"
[1] "La variable Dinero (COP) tiene una media de 174357.14, su mediana es 50000 y su moda es 20000"
# Formula modamoda <-function(x) { ux <-unique(x) ux[which.max(tabulate(match(x, ux)))]}link_encuesta <-"https://docs.google.com/spreadsheets/d/e/2PACX-1vRSn6T8sclb-P9UeGkh305w-8fs-rPR1_ritC2FPOLS2Ub13KUr_vF1dvRb0ZYr582s3aXD2gEVziGL/pub?gid=1539739636&single=true&output=csv"data <-read.csv(link_encuesta)# Edadmedia_edad <-round(mean(data$Edad), digits=2)mediana_edad <-median(data$Edad)moda_edad <-moda(data$Edad)# Alturamedia_altura <-round(mean(data$Altura..cm.), digits=2)mediana_altura <-median(data$Altura..cm.)moda_altura <-moda(data$Altura..cm.)# Dineromedia_dinero <-round(mean(data$Dinero.en.efectivo), digits=2)mediana_dinero <-median(data$Dinero.en.efectivo)moda_dinero <-moda(data$Dinero.en.efectivo)print(paste0("La variable Edad (años) tiene una media de ", media_edad, ", su mediana es ", mediana_edad, " y su moda es ", moda_edad))print(paste0("La variable Altura (cm) tiene una media de ", media_altura, ", su mediana es ", mediana_altura, " y su moda es ", moda_altura))print(paste0("La variable Dinero (COP) tiene una media de ", media_dinero, ", su mediana es ", mediana_dinero, " y su moda es ", moda_dinero))
Medidas de dispersión
Rango
Varianza
Desviación estándar
Curtosis
Gráficas
Módulo II: Variables aleatorias
Funciones de distribución y funciones de probabilidad